5 W About Search Engine
Lima W tersebuat adalah Who, What, Where, Why, dan When tentang search engine alias mesin pencarian. Kita akan mencoba mengetahui menjawab segala pertnyaan-pertanyaan diatas.
How (bagaimana), bagaimana mesin pencari bekerja?, pada dasarnya, sebuah mesin pencari menghubungkan kata-kata yang dimasukkan pada sebuah database yang diciptakan dari halaman-halaman website (sebuah indeks). Mesin pencari ini kemudian akan menghasilkan daftar URL (dan ringkasan isinya) yang dipercaya paling relevan dengan pertanyaan yang dimasukan.
Sebuah mesin pencari terdiri atas tiga bagian utama, yaitu pengindeks, indeks, dan sistem untuk menangani pertanyaan. bagian terakhir ini juga bertugas menjadi interface dan penghubung dari pertanyaan yang diajukan ke dalam indeks. Ia juga bertugas mengatur semua pertanyaan penting yang relevan dan menentukan peringkat populeritas. Tiga bagian inilah yang bergabung dan menentukan kualitas dan kecepatan mesin pencari.
Proses bagaimana kita bisa mendapatkan hasil dimulai oleh pengindeks. Pengindeks (atau sering disebut crawler) adalah program khusus yang akan melompat dari satu link ke link lain di internet. Ia akan mengikuti dan mencatat website yamg ditemukan untuk kemudian mengirimkannya kembali ke server untuk di indeks. Crawler mungkin dianggap sebagian besar orang sebagai robot kecil yang akan menjelajahi dunia cyberspace yang luas.
Versi awal crawler hanyalah mencari dan mengindeks judul website. namun , saat ini sudah lebih canggih karena mereka bisa mengindeks isi seluruh website, termasuk berbagai tipe file, seperti Adobe acrobat (PDF), dokumen microsoft office, file audio/vedio, dan bahkan metadata spesifik. Metadata merupakan informasi terstruktur yang diberikan pemilik website yang sedang diperiksa crawler. Crawler ini kemudian mengirimkan data yang ditemukan kedalam database besar yang disebut indeks. Indeks ini dipecah menjadi beberapa bagian, tergantung apakah data tersebut sudah diproses dan siap digunakan oleh pengguna. Indeks mentah lebih mirip dengan daftar yang digolongkan berdasarkan domain. Mengapa ini penting?, karena langkah berikutnya untuk menciptakan indeks yang cerdas adalah dengan membalikan data base pada dasarnya, umtuk membuat daftar kata yang berhubungan dengan URL.
Proses mempelajari indeks ini juga dianggap sebagai suatu analis. algoritma google pagerank salah satu contohnya. Ia mencari link dari sebuah halaman website, anchor text di sekitar link tersebut, dan populeritas dari halaman website yang terhubung ke halaman lain untuk kemudian mengkombinasikan untuk mendapatkan relevansi dari sebuah halaman atas pertanyaan sobat.